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基于 方差 最 大 化 旋转 变换 的 K 近邻 故障 诊断 策略 ， 


K W, WES, F 元 


(沈阳 化 工大 学 技术 过 程 故 障 诊断 与 安全 性 研究 中 心 ,沈阳 110142) 


摘 要 : 为 了 提高 FD-KNN 针对 潜 隐 变量 在 非 线性 和 多 模 态 过 程 中 的 故障 检测 能 力 ， 提 出 一 种 基于 方差 最 大 化 旋转 变 
换 的 开 近 邻 故 障 检测 与 诊断 策略 。 首 先 ， AGO 接 下 来 
在 该 正 交 空间 中 执行 FD-KNN 方法 进行 故障 检测 ; 最 后 ， 结 合 贡 献 图 方法 给 出 基于 贡献 图 的 故障 诊断 策略 。 通 过 一 
非 线性 模拟 实例 ,证 明 方法 对 潜 隐 变量 故障 诊断 是 有 效 的 ; 同时 , 在 典型 非 线性 工业 过 程 田 纳西 过 程 进行 测试 , 与 PCA、 
FD-KNN 和 PC-KNN 等 方法 进行 对 比 ， ES 
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Varimax rotationbased K nearest neighbors fault diagnosis strategy 
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Te! Abstract: Aiming to improve the fault detection ability ofFD-KNN in the nonlinear and multimodal process, this paper proposes 


a k nearest neighbors fault detection method based on varimax rotation (Rot-KNN) . First, implement varimax rotation in 


observed data set to obtain an orthogonal space. Next, implement FD-KNN in the new orthogonal space to detect faults. At last, 


propose a fault diagnosis strategy based on contribution chart. A nonlinear simulation example and the Tennessee Eastman (TE) 


phe processes of a typical nonlinear industrial process prove that the method is effective for the latent variable fault diagnosis. The 


experimental results indicate that the proposed method outperforms the PCA, FD-KNN and PC-KNN. 
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应 用 在 化 工 生产 过 程 中 并 且 取 得 了 可 喜 的 成 果 "“”。PCA 方法 依 
据 方 差 信息 通过 线性 变换 将 原始 空间 分 解 成 主 元 子 空 间 
(principal component subspace,PCS) 和 残 差 子 空 


随 着 工业 生产 的 快速 发 展 ， 过 程 监视 与 故障 诊断 技术 在 
证 生产 安全 、 提 高 生产 效率 等 方面 的 作用 变 得 越 来 越 重 要 。 subspace, RS)， 同 时 应 用 Hotelling'sT^ 和 平方 预测 误差 (squared 
于 分 布 式 控制 系统 可 以 自动 测量 和 存储 大 量 的 多 变量 采样 数据 ，“” prediction error, SPE) 两 个 统计 量 实现 对 上 述 两 个 子 空 间 的 状态 
因此 基于 数据 驱动 的 多 元 统计 过 程控 制 (multivariable statistical 监控 。T 和 SPE 控制 限 通 常 在 假设 过 程 变量 服从 多 元 高 斯 分 布 
process control, MSPCO) 方 法 已 经 成 为 当今 研究 的 热点 问题 I, 而 。 ”的 前 提 下 进行 确定 , 这 将 影响 PCA 方法 在 非 线性 过 程 的 故障 检 


间 (residual 


asni 


于 现代 生产 工艺 过 程 的 机 械 化 、 电 气 化 、 自 动 化 和 化 学 化 等 测 性 能 “”。 为 了 解决 非 线性 过 程 的 监控 问题 ， 一 些 基 于 PCA 的 
特点 , 大量 复杂 工业 过 程 具有 非 线 性 和 多 模 态 特征 , 典型 的 有 : 非 线性 方法 已 经 被 提出 , 同时 获得 了 快速 发 展 ”“。 近 些 年 , 基 
青霉素 发 酵 过 程 ， 半 导体 铝 蚀刻 工艺 过 程 Tennessee 于 核 理 论 的 主 元 分 析 (kernel principal component analysis, KPCA) 
Eastman(TE) 过 程 ， 高 分 子 聚 合 过 程 和 废水 处 理 过 程 等 请 9 。 方法 已 经 有 效 地 被 用 于 解决 非 线性 系统 的 过 程 监控 问题 “”。 

主 元 分 析 (principal component analysis, PCA) 作为 一 种 为 了 刻画 过 程 数 据 的 动态 特性 和 进行 相关 的 应 用 分 析 ， 通 过 增 
型 的 、 基 于 数据 驱动 的 多 元 统计 过 程控 制 方法 ， 已 经 被 广泛 地 广 时 间 序 列 变量 来 扩大 数据 矩阵 进而 将 其 自 相 关 特 性 纳入 到 相 
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LESS AB 
Jii", DPCA 是 一 


故障 诊断 中 具有 


种 将 传统 PCA 
法 ， 由 于 考虑 了 数据 中 的 序列 相关 性 ， 
良好 的 表现 。 

上 述 方法 ， 如 PCA 和 KPCA, X) 
用 于 多 模 态 过 程 通常 存在 较 高 的 误 报 情况 ”。 


阵 中 , 形成 了 动态 主 元 分 析 (dynamic PCA, DPCA) 


EE 


动态 多 变量 过 


程 的 方 
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此 在 含有 


] 于 监控 单 模 态 


时 清 系 统 的 


过 程 ; 将 其 应 


种 基于 
based on K-nearest neighbors, 
样本 与 其 近 
度 变换 是 首要 考虑 的 问题 。 


过 程 ， He 等 提 出 


邻 的 距离 相似 度 度量 当 


最 近 


FD-KNN)'*, 


为 了 监视 多 模 态 
邻 故 障 检测 方法 (fault detection 
FD-KNN 方法 应 用 当前 


ES 


TR 
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前 样本 状 


此 变量 的 尺 


通常 FD-HNV 与 Z-score 


标准 化 方法 


E 
结合 人 


Fd 


FE 用， 通过 Z-score FEW 


H 监控 变 ER 度 来 


的 检测 性 能 。 
LU 


然而 ， 当 样 


本 具有 较 高 维 
全 数据 的 距离 ， 这 将 产生 大 量 的 时 
也 提出 更 高 的 要 求 。 针 对 上 述 缺 陷 


数 时 ，FD-K 
闻 消 耗 ， 
, He 等 提 


是 高 FD-KN 


同时 对 存储 空 
出 一 种 基于 PCA 


需要 统计 


ER] 


MH 


D? 也 可 以 应 用 KDE 253b 6185 


于 核 密 
型 的 无 参数 分 布 估计 方法 ， 


控制 限 D2 时 判定 其 为 故障 样 


K OX, 


根据 非 中 心 的 卡 方 分 布 ， 确 定 置信 


度 估 计 (kernel density e 


REN oc 的 检测 控 


制 限 D2 2u, 


stimation, KDE) 方 法 是 


- 经 


已 经 取得 了 


ML, 


^, 


KNN 


c) 确 定 训 练 模 型 的 


体 计 
1) 离 线 建 模 
a) 在 j 
b) 应 月 


过 程 如 下 。 


| 练 集 X 中 查找 每 个 样 


待 检测 样 


JÆ o 


BN 


良好 的 效果 26]， 


AI D? 大 了 


种 


因此 


本 的 前 个 近邻 样本 ; 


ER (1) 计算 XX 与 近邻 距离 D? ; 


空 制 限 D: 。 


, 


i 


1 定 其 为 正常 样本 。FD- 


和 FD-ANN 相 结 合 的 检测 方法 (principal component-based 2) 在 线 检测 

knearestneighbor rule for fault detection, PC-KNN) ™™. Hie, Nj DEIAR X 中 寻找 待 检测 样本 x 的 前 £ 个 近邻 样本 ; 

用 PCA 获得 主 元 子 空间 ; 接 下 来 , 在 主 元 子 空间 中 执行 FPD-KANV DHAR CD 计算 记 与 近邻 距离 D2 

方法 。 PC-KNN 在 低 维 主 元 子 空间 中 计算 样本 间距 离 ， 这 将 降低 

Le a S Ns p mes o D? 与 控制 限 D? 比较 ， 若 D? >D 9 x, Juil, F 

检测 发 生 在 主 元 子 空间 的 故障 ;， 当 故障 完全 发 生 在 残 差 子 空 间 

时 ，PC-KNN 方法 是 无 效 的 。 综 上 ， 相 对 检测 结果 而 言 ，PC-K 则 x, 为 正常 。 

不 具有 优 于 FD-KNN 的 检测 性 能 。 由 于 变量 尺度 与 量 纲 差 异 影响 ， 通 常 在 过 程 监控 之 前 对 采 
考虑 到 PC-KNN 方法 的 上 述 缺 陷 及 FD-KNN 处 理 非 线性 样 数据 需要 进行 有 效 的 标准 化 处 理 。Z-score 是 一 种 常用 的 数据 

和 多 模 态 过 程 的 优势 ， 结 合 具有 非 线 性 和 多 模 态 特征 的 典型 工 预 处 理 方法 ， 通 过 调整 变量 的 均值 与 方差 ， 能 够 使 不 同 量 纲 变 

业 过 程 ， 本 文 提出 一 种 基于 方差 最 大 化 旋转 变换 的 k 近邻 故障 量 在 同一 尺度 下 进行 比较 。 因此, 通常 将 Z-score 与 监控 方法 结 

检测 与 诊断 策略 (varimax rotation -based k nearest neighbors fault 合 使 用 ， 提 高 经 典 算法 对 过 程 的 监控 能 力 ， 例 如 FD-ANN PCA 


detection and diagnosis strategy, Rot-KNN)。 方 差 最 大 化 旋转 是 
它 通 过 坐标 变换 使 各 个 因子 载荷 的 


在 PCA 中 使 用 的 一 种 方法 。 
方差 之 和 最 大 ， 
比 PC-KNN 方法 , Rot-KN 


同时 将 负载 矩阵 旋转 到 


虽然 计算 负载 


故障 检测 结果 更 全 面 , 不 存 


面 的 缺陷 ; 
量 故障 的 检测 能 


尽量 接近 简单 结构 。 相 
兽 大 , 但 
在 PC-KNN ERETT 


其 能 够 使 得 
间 故 障 检测 


KNN 方法 能 够 有 效 处 理 


E 够 提高 


问题 ,外 


多 模 态 等 特 生 


误 报 率 (false alarm rate,FAR)。 


TH E FD-KNN 方法 , Rot-KNN 可 以 提高 对 潜 隐 变 
JJ: 相 比 PCA、KPCA 和 DPCA 等 方法 ，Rot- 
有 非 线性 、 
过 程 故障 检测 率 (fault detection rate,FDR)、 降 低 


E 的 过 


DEUS 


1 FD-KNN 
FD-KNN 方法 的 基本 原理 是 使 用 样本 与 其 近邻 的 距离 度量 
样本 之 间 的 差异 。 首 先 ,在 训练 集中 查找 样本 X 的 前 个 近邻 
X {X,X,X O). 3b, i56 X 与 其 前 个 近邻 样 
本 的 距离 平方 和 |: 
D’ = b^ a) 
其 中 : d 为 样本 X 与 其 第 ;近邻 xO 的 欧式 距离 。 最 后 ， 


和 KPCA 等 。 
Z-score 与 FD-ANW 相 结合 
行 监控 是 有 效 的 。 假设 数据 自 


s ~ N(0,16,t ~ N(0,D). 


故障 样 


分 别 沿 Ss 和 tf 方向 偏 
例如 F1(64,0), F2(0,4). 


本 Fi 和 F2， 其 散 点 


的 


方法 对 变量 相互 独立 的 过 程 进 


随 


机 生成 200 个 训练 样本 


图 如 图 


如 


hi 离 数据 中 心 ， 


化 处 
中 故障 村 


c 


应 用 Z-score 方法 对 上 述 数据 集 进 


包含 两 个 测量 变量 AX =1,% =s E 


和 两 个 


长 


故障 尺 度 为 4 倍 标准 差 天 


Lr 


l(a) 所 示 。 故 障 样本 Fi 和 下 


其 结果 如 图 


1(b) 所 示 。 


出 上 述 


述 两 个 故障 ， 


本 与 训练 样本 分 离 ; 同时 , FD-ANN 方 法 
D? 的 检测 结果 如 图 2 所 示 。 


在 标准 化 后 
能 够 准 


可 以 看 出 ， 
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化 数 扩 
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(b) Z-score 标准 


数据 散 点 图 
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ERPF PAESE xL FI x, 是 相互 独立 的 ， 
有 较 好 的 检测 结果 。 但 当 变 量 之 间 存 在 
障 而 言 ， 上 述 方法 通常 存在 局 限 性 。 
如 下 关系 : 


FD-AKNV 相 结合 的 方法 
时 ， 对 于 微弱 故 
如 数据 集 的 两 个 测量 变量 


相关 性 


o 训练 
口 故障 
12 99964: tbi] E 
10 
aL 
atl 
4 
2 o 


图 2 


OFP 


OFf 


SS 


o 


D? 控制 图 


满 足 


X, = scos(0) t tsin(0) 
x, 7 —ssin(0) + tcos(0) ' 


PS 


3 所 示 。 
将 Z-score E FD-ANV fH 


检测 结果 如 图 
生 这 种 错误 结果 的 主要 原 医 
的 上 ， 观 测 变量 的 标准 化 并 
沿 着 8 和 [对 数据 进行 


结合 


其 中 = 74 ， DUE 


的 方法 


因此 Z-score 与 


例 


昌 集 的 分 布 如 
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4 所 示 。 可 


以 看 出 Ir 
是 Z-score 方法 被 


故障 2 被 误 检 为 正 


TN 


p? 


到 。 就 上 例 而 言 ， 如 果 按 


然后 沿 新 的 方向 进行 标准 化 处 理 


不 能 同步 标 ; 
化 , 则 两 个 故障 均 角 
照 数 据 分 散 程度 建立 新 的 4 
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可 以 提高 FD-KN 
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(a) 原 始 数据 


图 3 数据 散 点 图 
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(b) Z-score 标准 化 数据 


o 训练 
7 口 故障 
99% 控 制 限 


图 4 DD? 控制 图 


应 用 在 观测 变量 
化 变量 9 和 + 。 
外 被 FD-KNN 检测 
标 体系 ， 
的 检测 能 


在 当前 数据 集 时 ， 
常 点 。 产 


如 果 


K 成 ， 


2 ”基于 方差 最 大 化 旋转 变换 的 k 近邻 故障 检测 与 诊 

断 策 略 
21 基于 方差 最 大 化 的 旋转 变换 

设 随 机 向 量 X = [XX X, MM pd 其 协 
方差 矩阵 也 = 了 ECx 4. p, (i= SD) 分 别 为 也 的 特 
征 值 和 特征 向 量 且 A, 按 降序 排列 。 

考虑 线性 变换 : 

y-xP Q) 

其 中 yzlyey; y. , 卫 =[p,,p…Ppu,] 是 一 个 正 交 和 拢 


可 以 看 出 ,随机 变量 y, 的 方差 和 y S y; C J) 的 协 方差 
分 别 为 


Var(y;)) » E(y; y,)=4 G) 
Cov(y;, y;)=p; Ep; =0 4) 
由 式 (3) (4) TA y; (i =1,2,…,n) 的 方差 是 按照 降序 


排列 的 ;新 的 互 异 随机 变量 y, 5 y, 的 协 方差 为 0， 即 y, s y; 
是 不 相关 的 。 由 文献 [L2] 可 知 ，y (— 2, n) 代表 数据 变 
异性 最 大 的 方向 ， 同 时 其 协 方 差 和 矩阵 
人 =diag{ 入 和 入,} 个 简单 但 是 精炼 的 对 角 结 构 
22 ”基于 方差 最 大 化 旋转 变换 的 K 近邻 故障 检测 与 诊断 策略 

BIARN X pao EFM 和 分别 为 样本 数量 和 监 
控 变 量 数量 。 首 先 计算 义 ,, 的 协 方差 矩阵 叶 并 将 于 进行 特征 
分 解 , 记忆 的 特 量 分 别 为 4 . p, (i=1,2,…,n) ， 


mxn 


征 值 与 特征 向 
HA 降序 排列 。 接 下 来 ， 依 据 公式 (2) 将 X 作 旋 转变 换 


Y= XP 并 将 了 进行 标准 化 处 理 ， 标 准 化 数据 集 记 为 
Y=YL ?。 最 后 ， 应 用 FD-ANN 方法 在 数据 集 了 上 进行 故障 
检测 。 对 数据 集 沿 着 正 交 且 变异 性 大 的 方向 依次 进行 标准 化 处 
里 ， 然 后 应 用 FD-KNV 方 法 进行 故障 检测 ， 可 以 提高 FD-ANV 的 
故障 检测 率 。 

Rot- ANN PAKETE UN F o 

1) 模 型 建立 

a) 对 训练 集 X 进行 中 心 化 处 理 ; 


b) 将 X. 的 协 方差 矩阵 忌 进行 特征 分 解 ; 

c) 作 旋转 变换 了 = XP 并 将 了 进行 标准 化 ， 获 得 中 心 化 矩 
EF: 

d) 在 立 上 执行 FED-ANWV 方 法 并 根据 KDE 方法 确定 统计 控制 
WD. 

2) 在 线 检测 

对 于 一 个 测试 样本 x, 执行 以 下 步 又 进行 故障 检测 。 


ayf x, 依据 模型 建立 中 第 中 步 的 均值 进行 中 心 化 处 理 ; 

b) 作 旋转 变换 Yo = XP 并 按照 模型 建立 中 第 @ 步 将 y。 
进行 标准 化 ， 结 果 记 为 了 ; 

o£ y PAR y, 的 K EAE 

d)t& D, 5 D: 
Xe 为 正常 样本 。 

当 一 个 样本 被 检测 为 故障 时 , 执行 相应 的 诊断 方法 分 析 故 


本 并 计算 距离 统计 值 D,; 
# D, > D2 , 则 ,为 故障 样本 ; 否则 ， 


T naX i 
C nina 


录用 稿 ILC Kit 2 


RA K 成 ， 等 : 基于 方差 最 PTA N 
障 产生 的 原因 是 必要 的 。 在 经 典 的 方法 中 ， 如 PCA 和 KPCA, d) 比 较 C, (i =1,2,…,n) 。 通 常 较 大 的 C， 所 对 应 的 变量 
通常 应 用 贡献 图 的 方法 进行 故障 诊断 2720。 对 于 一 个 已 被 中 心 多 为 异常 变量 
4E FEARS X — [5,357 x,] ,经 过 基于 方差 最 大 化 旋转 变换 后 变 
换 成 y=[yi,y,…,y,]， 其 中 y= XP 。 样 本 X 的 统计 指标 ”3 ”仿真 实验 
D^ "CB bti S 
3.1. 数值 例子 
k 
D? =Z |v- y^ 本 例 将 通过 一 个 包含 4 个 观测 变量 的 非 线 性 实例 验证 本 文 
jl 方法 的 有 效 性 ， 具 体 模 型 如 式 (10〉 所 示 。 
大 
- e y?)4"^[ (5) x -5s-t 
3 n Xz -— 3s +t 
=% Cy, 2 » y / À, X, mu pf (105 
j=1 i=1 
"n . X, = s 
其 中 : y 为 了 的 第 了 近邻 样本 。 于 是 ， 变 量 y, p? 的 贡献 
可 以 整理 成 其 中 : 潜 隐 变量 S.T 分 别 在 区 间 [-50,50] 和 [0,1] 上 服从 均匀 分 布 。 
由 模型 式 (10) 随机 生成 500 个 样本 构成 训练 集 ; 随机 生 


G) 


Yn y / À, 


成 100 个 样本 用 于 校 验 不 同方 法 的 有 效 性 。 通 过 调整 潜 隐 变量 
t 的 初始 值 ,设置 两 类 故障 ,相对 于 变量 1 的 均匀 分 布 , 第 二 类 


(6) 


k 
con, — >》 (六 一 
Jal 


若 样本 区 已 经 被 检测 为 故障 且 con, >D /1 时， 确定 加 故障 较 第 一 类 故障 具有 更 大 的 偏离 尺度 。 图 5 给 出 上 述 样本 的 
为 经 过 坐标 旋转 后 的 失控 变量 。 潜 隐 变量 Si 分 布 情 况 ， 同 时 图 6 给 出 各 个 变量 
X (i 1,2, S4) 的 分 布 情况 。 


其 


AN 


F Y, =P, 


n 
> X Pin 
i=l 


n 
= ah = (j) 
和 ys =X p,- Dx Pin > 
icl 


首先 , 执行 传统 的 FD-ANV 方 法 进行 故障 检测 , 经 过 寻 优 测 


pg E , k-5. 在 检测 之 前 ,应 用 Z- 法 对 数据 集 进行 
CO pip Pues Ph]， 因 此 ， 式 (9) 可 以 整理 成 如 下 形 ee ne ean 
EET , 能 有 效 检 测 第 一 类 故障 。 由 图 5 和 6 可 以 看 出 ， 第 一 类 故障 在 
ODN On 潜 隐 变量 1 的 方向 发 生 微弱 偏 移 ， 但 这 种 偏 移 在 观测 变量 
con, -之 C, — Y; 2.6. x ns Jr x (212,4) 上 并 没有 直观 表现 ， 换 句 活 说 ， 单 从 观测 变 
a 量 的 角度 进行 观察 ， 第 一 类 故障 样本 更 像 一 组 正常 的 样本 。 因 
= Y, — yP X(x, -xpa 1A 此 , 沿 着 观测 变量 xX (i — 1,2, 4) WT Z-score 方法 ,并 不 能 
i=1 \ j=l 5 提高 FD-ANV fy fs: 3 E Be 
n k 200 mm 
m X P367 2 yp, 2) 180 5 e 
i- j=1 < 故障 1 
(FR 160 p 故障 2 
n k 140 
E = - Y(G, » XN Pin 2) 120 } 
e izl X EL a 
式 (7) 可 得 ， 变 量 x 对 y, 的 贡献 为 
k 
Con, , — x, Do - Y Pin / 力 ) (8) 
j=1 
若 经 过 式 (6) 计 算 存 在 5 个 失控 变量 J, (有 ==1,2,…,s) ， 则 原 
IMs x, EROS EE mode 
S S, St HARB 
C, = > |Com， (9) 
在 故障 诊断 过 程 中 ， 通 常 认为 具有 较 大 贡献 的 变量 的 异常 
变化 是 引起 故障 发 生 的 主要 原因 。 
1) 故 障 诊断 


» x 10^ 


x] 为 一 个 故障 样本 ， 3 
,y= 二 XP ， 有 具体 诊断 过 程 如 下 。 
(i ==1,2,…,n) 对 D? 的 贡献 E 


B 设 x-[«q.X 
y=[y,, >， 
a) 根据 式 (6) 计算 变量 y, 


con;， 并 判定 失控 变量 数目 5 ; 
b) 根 据 式 (8) 计算 变量 x (i 二 1,2,…,n) 对 5 个 失控 变量 


图 6 变量 x(i=1,2,...,4) 分 布 


的 贡献 Con; ; ,j=1,2,…,5 


o] 根 据 式 (9) 计算 x, (12, n) 的 总 贡献 C : 


VAO0O. 


训练 
故障 1 
故障 2 


99% 控 制 限 


400 600 800 
样本 


图 7 FD-KNN 检测 结 曙 
接 下 来 , Rot-KNV 方 法 在 本 例 中 被 执行 , 同时 将 其 


然后 ， 对 中 心 化 数 ] 


局 


法 进行 比较 。 首 先 将 观测 数据 集 进行 中 心 化 处 理 。 
执行 基于 方差 最 大 化 的 旋转 变换 ， 获 得 变 


据 集 ， 


第 一 类 故障 已 经 做 


己 被 标准 化 的 各 个 变量 分 布 如 图 8 所 示 。 
离 了 正常 轨迹 。 接 下 3 


羊 本 (两 类 故障 中 


的 第 


据 集 上 执行 FD-ANV 方 法 ,检测 结果 如 图 9 所 示 
以 看 出 ， 两 类 故障 完全 被 检测 ， 同 时 从 故障 尺度 观测 ， 故 障 
于 故障 1 的 故障 尺度 ， 这 与 初始 化 设置 是 一 致 的 。 
oo | 
200 400 600 800 
样本 
图 8 变量 yi (i=1,2,.…,n) 分 布 

训练 — 

校 验 

故障 1 

故障 2 

99955642: til PR 

图 9. Rot-KNN 检测 结果 
在 本 例 中 根据 Rot-KNN 的 故障 检测 结果 , 分 别 对 两 个 故障 


(10) 所 示 。 接 


来 


贡献 图 


区 


x| dn 


台 变 量 x 和 


HEE x 和 


xX, 对 失控 变量 y, 
Hl x, 的 
刑 (10) 可 知 ， 潜 隐 变 量 1 的 异常 变化 可 以 通过 变量 


检测 结果 


50 个 样本 ) 进行 了 诊断 分 析 。 首 先 根 拉 
X (6) 确定 经 过 旋转 变换 后 第 四 个 变量 y 为 失控 变量 ， 如 图 
， 应 用 公式 CD 计算 原始 变量 对 失控 变量 


(1012. 所 示 。 可 以 看 出 ， 对 于 上 述 两 个 故 


et 


H 


o 


有 较 大 贡献 ， 因 此 可 以 


K 成 ， 基于 方差 ROGER KI 


Eae £u. 


和 x, 的 线性 组 合 来 确定 ， 因 为 三 者 满足 


8t = 5x, —3X。 


如 下 关系 


ES Contr of y, to DĈ, i=1 2 3 4 


ES 
o 
o 


Contribution of y. to D? 


a 
o 
o 


1. 故 障 1 中 第 S0 个 样本 ; 


图 10yi 的 贡献 : 


2. 故 障 2 中 第 50 个 样本 


| —] Contr of xi to y4， i=1234 


Contribution ofx toy 


图 11 xi 的 贡献 ，1. 故 障 1 中 第 50 个 样本 ; 2. 故 障 2 rn] 
为 了 与 Rot-KNN 方法 进行 对 比分 析 , 传统 的 PCA-T2、 
SPE 和 PC-KNN 等 方法 分 别 对 本 例 进行 了 故障 检测 


第 50 个 样本 


PCA- 
首先 , 根据 


o 


方差 累计 贡献 率 (CPV-9090) ，2 个 主 元 被 选取 ， 同 时 将 原始 


空间 分 成 主 元 子 空间 和 残 差 子 空间 。 图 12 给 出 PCA-T?. 


SPE 的 检测 结果 。 结 合 两 个 子 空间 的 检测 结果 ， 


第 一 类 故障 没有 被 检测 出 来 的 主要 原因 是 


第 二 类 故障 被 检测 出 来 , 说明 上 述 方法 对 大 尺度 故障 是 有 效 的 。 
T? 和 SPE 两 个 统计 


PCA- 
可 以 发 现 只 有 


控制 限 的 确定 过 程 通常 假设 变量 服从 多 元 高 和 


分布， 


而 本 例 


变量 并 不 满足 服从 多 元 高 斯 分 布 的 假设 , 如 图 


空间 , 执行 FD-KN 
zs. PC-KNN 方法 监控 样本 在 主 元 子 空 
样本 在 残 差 子 空间 的 变化 。 


D 


By 


13 所 示 。 在 上 


方法 , Hl PC-KNN, 检 测 结 果 如 图 14 
间 的 变化 ， 
此 ， 当 故障 发 生 完全 发 生 在 残 差 


并 没有 考虑 


较 高 的 误 报 率 ， 


子 空间 时 ，PC-KNN 通常 具有 


检测 结果 证 实 了 这 


0 100 200 300 400 500 600 T00 
Hk 


12 PCA-T?, 


ss 


PCA-SPE 检测 结果 


800 


201805.00485v1 


chinaXiv: 


录用 稿 


: 
i | | 


2.42012 24012 450517 5 0 5 
X 
X x, x " 


图 13 xi 高 斯 分 布 统计 


训练 
o 校 验 
< Musa 
10? > 故障 2 
99% 控 制 限 


PC-KNN-D? 


图 14PC-KNN 检测 结果 


3.2 TE 过 程 

TE 过 程 是 Downs 等 人 基于 Tennessee Eastman 化 学 公司 实 
际 化 工 生产 过 程 提 出 的 一 个 仿真 系统 BU。TE 仿真 系统 对 单元 
操作 间 的 非 线性 关系 和 物料 与 能 量 平 衡 以 及 汽 、 液 相 平衡 规 得 
进行 了 准确 的 设计 ,对 于 化 工 过 程 的 各 类 真实 故障 实现 了 模拟 。 
于 整个 系统 各 部 分 之 间 耦 合 严重 、 高 度 非 线性 且 开 环 不 稳定 ， 
在 过 程控 制 技 术 、 过 程 监控 和 优化 以 及 过 程 运行 系统 集成 的 基 
础 平台 的 研究 领域 中 得 到 了 广泛 的 应 用 B1。 如 图 15 所 示 ，TE 
过 程 包含 五 个 操作 单元 : 反应 器 、 冷 凝 器 、 循 环 压缩 机 、 分 离 
器 和 汽 提 塔 ; 包含 四 种 气体 原料 A、C、D 和 E, 两 种 液态 产物 
G 和 H, 还 包含 副 产 物 F 和 惰性 气体 B. 整 个 过 程 共 包含 22 个 连 
续 过 程 测量 变量 、19 个 成 分 测量 变量 和 11 个 控制 变量 。TE 过 
旦 是 一 个 常用 的 标准 问题 (benchmark problem), 其 较 好 地 模拟 了 
实际 复杂 工业 过 程 系统 的 许多 典型 特征 ， 因 此 被 作为 仿真 例子 
广泛 应 用 于 控制 、 优 化 、 过 程 监控 与 故障 诊断 的 研究 中 B2 -39 。 
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图 15 TE 过 程 
TE 仿真 系统 通过 3 分 钟 采 样 间隔 不 仅 能 够 模拟 正常 操作 
环境 , 同时 还 可 以 模拟 21 种 故障 环境 P71 在 本 节 中 , 依据 文献 
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K 成 ， 等 : 基于 方差 最 大 化 旋转 变换 的 民 近 邻 故障 诊断 策略 


[36], 选 取 33 个 变量 对 故障 进行 分 析 ; 960 个 正常 样本 被 


T£ 


立 模 型 ; 480 个 正常 样本 被 用 于 模型 校 验 ; 每 种 故障 包含 960 个 


样本 ， 同 时 故障 于 161 时 刻 被 引入 并 持续 到 过 程 结束 。 


如 文献 [35] 介 绍 ， 由 于 故障 3,9 和 15 的 故障 尺度 较 小 且 整 
个 过 程 表 现 平稳 ,因此 各 种 方法 均 不 能 有 效 检测 以 上 过 程 故障 ; 
PCA-T?, PCA-SPE 和 FD-ANV 等 方法 可 以 及 时 准确 地 检测 故障 
1、2、6、7、8、12、13 和 14， 且 故障 检测 率 达 到 95% 以 上 ; 


B 5. 10. 14. 16 和 19 进行 检测 和 诊断 并 与 PCA-T?, 
SPE, FD-ANV 等 方法 进行 对 比分 析 ， 相 关 参 数 设置 见 表 


种 方法 的 故障 检测 率 和 误 报 率 见 表 2。 由 表 2 可 以 看 出 ， 


基于 PCA 的 不 同方 法 ， 如 KPCA 和 DPCA， 对 故障 5、10、16 
和 19 的 故障 检测 率 均 低 于 85%。 在 本 节 中 ， 将 Rot- 对 故 


PCA- 
1， 各 
对 于 


故障 14，Rot-AhNV 方 法 同样 具有 良好 的 检测 性 能 ， 故 障 检测 率 
达到 100%， 同 时 故障 误 报 率 低 于 其 他 方法 ， 对 于 故障 5. 10. 


16 和 19，Rot-ANV 的 故障 检测 率 高 于 90%， 而 其 他 方法 的 故障 


检测 率 均 低 于 60%. B 16 给 出 Rot-KNV 与 FD-KANW 关 于 故 
10、16 和 19 的 故障 检测 控制 图 。 
表 1 参数 设置 


障 5、 


主 元 数 (PCs) 近邻 数 (k) 
PCA 16 - 
FD-KNV - 3 
Rot-KNV - 3 


表 2 各 种 方法 故障 检测 率 与 误 报 率 (FDR/FAR) 


Fault PCA-T PCA-SPE FD-KNV Rot- NNV 
30.13 30.75 27.13 100.00 
5 
/1.88 /4.38 /0.00 /0.05 
49.25 55.88 45.00 90.63 
10 
/1.88 /3.13 /0.63 /0.10 
99.63 100.00 100.00 100.00 
14 
/0.63 /3.75 /0.93 /0.63 
35.75 53.13 33.00 92.38 
16 
/17.50 /8.13 /6.88 /3.75 
20.63 35.50 13.88 91.38 
19 
/0.63 /1.88 /0.00 /1.25 


在 本 节 中 ， 应 用 基于 贡献 图 的 故障 诊断 策略 对 上 述 故障 进 


行 了 诊断 , 诊断 结果 如 图 17 所 示 。 由 于 本 文 方法 与 其 他 方法 均 


能 有 效 检测 故障 14， 因 此 首先 对 故障 14 进行 故障 诊断 ， 


校 验 


本 文 方法 的 有 效 性 。 故 障 14 发 生 的 主要 原因 是 反应 器 冷却 水 
阀门 被 粘 住 。 该 类 型 故障 直接 引起 反应 器 温度 (x9) 、 反 应 器 冷 
却 水 出 口 温度 (x21) 和 反应 器 冷却 水 流量 (x32) 的 异常 变化 P9]。 
图 17(a) 给 出 本 文 方法 对 故障 14 的 诊断 结果 。 可 以 看 出 变量 xz， 


xi, xa 对 统计 量 D? 贡献 显著 ， 这 说 明 本 文 诊 断 结果 与 上 述 分 
析 相 一 致 , 验证 了 本 文 诊断 方法 的 有 效 性 。 接 下 来 , 对 故障 5、 


10 和 16〈 本 文 方法 具有 较 高 检测 率 ) 进行 故障 诊断 ， 图 
d) 给 出 各 类 故障 诊断 贡献 图 


17 Cb- 


。 冷 凝 器 冷却 水 入 口 温 度 异 常 变化 


引起 故障 5 的 发 生 ， 这 将 直接 影响 冷凝 器 冷却 水 出 口 温 度 (x33) 


201805.00485v1 
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和 汽 提 塔 下 洲 (x17) 的 测量 上述 结 论 通 过 故障 5 的 诊断 结果 (图 
17 b) ) 得 到 证 实 。 进 料 C 温度 的 异常 变化 引起 故障 10 的 发 
生 ， 这 将 直接 影响 汽 提 塔 下 溢 Cx7z) 和 汽 提 塔 温度 Guo 的 正常 
测量 ， 图 17〈c) 给 出 故障 10 的 诊断 结果 。 图 17 〈d) 给 出 故 
障 16 的 诊断 结果 。 可 以 看 出 ， 故 障 16 主要 是 由 于 汽 提 塔 相关 
变量 的 异常 变化 所 引起 的 , 如 汽 提 塔 下 溢 (x17)、 汽 提 塔 温度 Geis) 
和 汽 提 塔 气 阀 (x31). 换 名 话说， 该 类 型 故障 主要 发 生 在 汽 提 塔 精 
制 过 程 中 。 
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(d) 故障 19 
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(d) 故障 16 


&| 17 Rot-KNN 故障 诊断 结 


本 文 为 提高 FD-KNV 方法 对 潜 隐 变量 故障 的 检测 率 ， 提 出 


基于 方差 最 大 化 旋转 变 
一 个 模拟 实例 和 一 个 
KNN 和 PC-KNN 进行 对 


E 


换 的 近邻 故障 检测 方法 ，Rot-ANV。 通 
工业 实例 ， 与 传统 监控 方法 PCA、FD- 
上 ， 实 验 结果 验证 了 本 文 方法 的 有 效 性 。 
分 析 优 于 FD-KV fü PC-KNV, 但 是 其 具 


本 文 方法 从 检测 性 能 上 
有 较 高 的 计算 复杂 性 。 


娠 此， 降低 复杂 的 计算 过 程 是 本 文 方法 


的 下 一 步 研究 问题 。 同 


时 ， 关 于 近邻 数 k 的 确定 方法 也 是 一 个 
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开放 研究 的 问题 ， 本 文 是 通过 交叉 验证 的 方法 确定 近邻 数 ， 确 
定 过 程 较为 复杂 。 接 下 来 在 Rot-KWN 方法 中 将 重点 研究 近邻 数 
的 确定 问题 。 
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